Délestage pour l'analyse multidimensionnelle de flux de données
نویسندگان
چکیده
Résumé. Dans le contexte de la gestion de flux de données, les données entrent dans le système à leur rythme. Des mécanismes de délestage sont à mettre en place pour qu’un tel système puisse faire face aux situations où le débit des données dépasse ses capacités de traitement. Le lien entre réduction de la charge et dégradation de la qualité des résultats doit alors être quantifié. Dans cet article, nous nous plaçons dans le cas où le système est un cube de données, dont la structure est connue a priori, alimenté par un flux de données. Nous proposons un mécanisme de délestage pour les situations de surcharge et quantifions la dégradation de la qualité des résultats dans les cellules du cube. Nous exploitons l’inégalité de Hoeffding pour obtenir une borne probabiliste sur l’écart entre la valeur attendue et la valeur estimée.
منابع مشابه
Modèle conceptuel pour l'analyse multidimensionnelle de documents
Résumé. OLAP et les entrepôts de données sont utilisés pour l’analyse de données transactionnelles. De nos jours, avec l’évolution d’Internet et le développement de formats d’échange de données semi-structurées comme par exemple XML, il est possible de considérer les documents comme source d’analyse. En conséquence, un environnement d’analyse multidimensionnel adapté à ce type de données est né...
متن کاملUne approche spatio-multidimensionnelle pour l'analyse des aléas environnementaux
Résumé. Les entrepôts de données spatiales et les systèmes SOLAP permettent l’analyse en ligne de gros volumes de données géo référencées. Dans un contexte de gestion des risques naturels, ces systèmes ont été utilisés avec succès sur des données officielles dont la collecte suit un processus bien établi. Le développement récent d’outils collaboratifs pour la saisie de données géographiques, y ...
متن کاملApproche de modélisation multidimensionnelle des données complexes : application aux données médicales,
Résumé. La vocation d’un entrepôt de données est l’analyse de données pour l’aide à la décision dans les entreprises. La modélisation multidimensionnelle est la base des entrepôts de données et de l’analyse en ligne (OLAP). Ces techniques sont efficaces pour traiter les données simples numériques, mais elles ne sont pas adaptées aux données variées et hétérogènes provenant de différentes source...
متن کاملPortail Web de Veille Stratégique pour Mobile
Les techniques d’analyse multidimensionnelle sont actuellement bien maîtrisées pour toutes les données quantitatives disponibles sur les systèmes d’information des entreprises ou des administrations à condition que le SGBD s’y prête, que le schéma de la base soit adapté et que les données soient de qualité (homogènes, à jour, complètes, granularisées, compatibles,...). Il est toujours possible ...
متن کاملL'analyse relationnelle pour la fouille de grandes bases de données
Résumé. Dans cet article nous montrerons, brièvement, les possibilités offertes par la théorie de l'analyse relationnelle, initiée dans les années 1980 à IBMCorp. Nous nous concentrerons sur les avancées théoriques et méthodologiques obtenues grâce à cette théorie pour fusionner l'information et pour traiter et analyser de grandes quantités de données qu'elles soient de type structuré ou non st...
متن کامل